# MediaWikiDump

[MediaWiki XML Dumps](https://www.mediawiki.org/wiki/Manual:Importing_XML_dumps) 包含了维基的内容（包括所有修订版本的维基页面），但不包含与网站相关的数据。XML dump 并不能完全备份维基数据库，它不包含用户账户、图片、编辑日志等。

## 安装和设置

我们需要安装几个 Python 包。

`mediawiki-utilities` 支持未合并分支中的 XML schema 0.11。

```bash
pip install -qU git+https://github.com/mediawiki-utilities/python-mwtypes@updates_schema_0.11
```

`mediawiki-utilities mwxml` 存在一个 bug，修复 PR 正在等待中。

```bash
pip install -qU git+https://github.com/gdedrouas/python-mwxml@xml_format_0.11
pip install -qU mwparserfromhell
```

## 文档加载器

请参考[使用示例](/docs/integrations/document_loaders/mediawikidump)。

```python
from langchain_community.document_loaders import MWDumpLoader
```